Datenanalyse

Die Windgeschwindigkeit reicht von 0 km/h bis zu etwa 35 km/h, in wenigen Fällen werden Werte von über 40 km/h erreicht. Eine Saisonalität lässt sich nicht erkennen, allerdings gibt es Anfang des Jahres gelegentlich höhere Werte.

In den Boxplots lässt sich noch einmal erkennen, dass die Windgeschwindigkeit Anfang des Jahres etwas höher ist als in anderen Monaten.

Die Werte sind rechtsschief um den Mittelwert verteilt.

Korrelationsanalyse

Liniendiagramm (Verlauf)

Es lässt sich kein Zusammenhang zwischen Stromverbrauch und Windgeschwindigkeit erkennen. Die Merkmale bewegen sich asynchron, gemeinsame oder gegensätzliche Verläufe sind nicht erkennbar. Dies gilt auch für die gleitenden Durchschnitte.

Stromverbrauch nach Windgeschwindigkeit (Scatterplot)

Auch im Scatterplot lässt sich zunächst kein Zusammenhang feststellen. Die lineare Regression deutet zwar darauf hin, dass der Stromverbrauch mit der Windgeschwindigkeit leicht zu steigen scheint, allerdings handelt es sich hier eher um einen zufälligen Effekt, der unter anderem durch Ausreißer und die bereits oben beschriebene Verteilung zurückzuführen ist.

Stromverbrauch nach Windgeschwindigkeit (Boxplot)

Auch in den Boxplots lässt sich kein Zusammenhang zwischen der Windgeschwindigkeit und dem Stromverbrauch erkennen.

Regressionsanalyse

Durch die Regressionsanalyse wird geprüft, inwieweit sich der Verlauf des Stromverbrauchs anhand der verfügbaren exogenen Merkmale modellieren lässt. Es geht dabei noch nicht um die Erstellung eines Vorhersagemodells. Stattdessen wird die Regressionsanalyse eher mit Blick auf potenzielle Zusammenhänge, Korrelationen und Muster beziehungsweise generelle Verläufe durchgeführt. Aus diesem Grund bietet sich eine Funktion sechsten Grades an. Dafür wird mit den Daten von 2015 bis 2018 und den entsprechenden Merkmalen eine Regression sechsten Grades durchgeführt, welche dann mit den Daten für 2019 getestet wird. Wie bereits erwähnt, gibt es 2020 und 2021 Abweichungen vom ansonsten üblichen Verlauf. Daher werden nur die Daten bis einschließlich 2019 verwendet.

Regression mit Windgeschwindigkeit

Die Regression auf die Windgeschwindigkeit zeigt, dass das Modell so gut wie gar keine Informationen aus den Daten generalisieren kann. Es kann weder die wöchentliche noch die jährliche Saisonalität erfasst werden. Mit fast 15% Abweichung ist das Modell praktisch unbrauchbar.

Regression mit Arbeitstag und Windgeschwindigkeit

Wird das Modell um die Arbeitstage erweitert, kann zwar die wöchentliche Saisonalität abgebildet werden, allerdings sind quasi alle Verbesserungen auf den Indikator für Arbeitstage zurückzuführen. Ein zusätzlicher Informationsgehalt lässt sich bei der Windgeschwindigkeit nicht erkennen.

Regression mit Arbeitstagen, Temperatur, Tagesstunden und Windgeschwindigkeit

Wird die Windgeschwindigkeit den aussagekräftigen Merkmalen hinzugefügt, lässt sich auch hier keine zusätzliche Verbesserung erzielen. Die aussagekräftigen Merkmale werden stattdessen durch das zusätzlich Merkmal verwässert und die Qualität des Modells verschlechtert sich.

Fazit

Die Windgeschwindigkeit steht in keinem Zusammenhang mit dem Stromverbrauch und wird daher bei der weiteren Modellierung nicht verwendet.